Parada óptima en tiempo continuo mediante aprendizaje por refuerzo profundo CARLOS: algoritmo de RL profundo para parada óptima en tiempo continuo sin discretización, mejorando precisión y eficiencia en valoración de opciones. 2026-06-17 · 2 min